稀疏特征电路 Sparse Feature Circuits
Sparse Feature Circuits: Discovering and Editing Interpretable Causal Graphs in Language Models (ICLR ’25)
卧底特工 Sleeper Agents
Sleeper Agents: 训练能在安全训练中持续欺骗的大语言模型
阶段性模型差异比较
Stage-Wise Model Diffing 阶段性模型差异比较
训练后的 Transformer 可以在上下文中学习线性模型
Trained Transformers Learn Linear Models In-context (JMLR ’24)
干预,在何处及如何进行?大规模非线性 SCM 的主动因果发现
Interventions, Where and How? Experimental Design for Causal Models at Scale
DAD 与贝叶斯强化学习
翻译自 Deep Adaptive Design and Bayesian reinforcement learning by Adam Foster
深度适应性设计 DAD
Deep Adaptive Design: Amortizing Sequential Bayesian Experimental Design
[Adversarial Robustness] 2 Linear models
翻译自 NeurIPS 2018 tutorial “Adversarial Robustness: Theory and Practice” by Zico Kolter and Aleksander Madry
[Adversarial Robustness] 1 Introduction to adversarial robustness
翻译自 NeurIPS 2018 tutorial “Adversarial Robustness: Theory and Practice” by Zico Kolter and Aleksander Madry
利用逆倾向分数 (IPS) 降低选择偏差
Recommendations as Treatments: Debiasing Learning and Evaluation
[线性代数] 第2章 有限维向量空间
《线性代数应该这样学》第2章:有限维向量空间
[线性代数] 第1章 向量空间
《线性代数应该这样学》第1章:向量空间
数据不足下的学习 Part 1:半监督学习
翻译自 https://lilianweng.github.io/posts/2021-12-05-semi-supervised/
MapReduce
MapReduce: Simplified Data Processing on Large Clusters
支持向量机
ML Notes 03: Support Vector Machine(SVM)
[MySQL 04] 索引(上)
《MySQL实战45讲》04 | 深入浅出索引(上)
[MySQL 03] 事务隔离
《MySQL实战45讲》03 | 事务隔离:为什么你改了我还看不见?
[MySQL 02] SQL更新语句执行流程
《MySQL实战45讲》02 | 日志系统:一条SQL更新语句是如何执行的?
[MySQL 01] SQL查询语句执行流程
《MySQL实战45讲》01 | 基础架构:一条SQL查询语句是如何执行的?
贝叶斯模型
ML Notes 02: Bayesian Model
决策树
ML Notes 01: Decision Tree